3.5 在因果效应的回归中使用倾向得分

本章介绍倾向得分的几个应用:

这是基于下面的原因:

1 在回归中将倾向得分作为一个协变量

根据 这个定理, 如果 X 条件下可忽略性成立, 则在 e(X) 下也成立: Z{Y(1),Y(0)}|e(X). 类似 (2.2), τ 也可以无参数地表示为 τ=E[E{Y|Z=1,e(X)}E{Y|Z=0,e(X)}], 这启发了 YZ,e(X) 上回归的算法. 最简单的 OLS 就是 Y{1,Z,e(X)} 上的回归. 这里 Z 的系数 τe 作为估计量. 为了简单起见, 我们讨论群体 OLS: argmina,b,cE{YabZce(X)}2, 然后定义 τeZ 的系数. 如果我们有一个正确的倾向得分模型, 且结果模型却是关于 Z,e(X) 是线性的, 那它关于 τ 是一致的. 更有趣的是, τe 可以估计 前面 提到的 τO, 如果我们有一个正确的倾向得分模型, 即使结果模型完全错误.

定理 1.1

如果 Z{Y(1),Y(0)}|X, 则 Y{1,Z,e(X)} 上的群体 OLS 拟合下, Z 的系数是 τe=τO=E[hO(X)τ(X)]E[hO(X)], 回顾一下 hO(X)=e(X)[1e(X)], τ(X)=E[Y(1)Y(0)|X].

这说明重合度条件再也不需要了. 即使有些单元的 e(X)0/1, 它们的权重都是 e(X)[1e(X)]=0, 所以它们不用为 τO 贡献任何东西.

从证明看出, 我们可以简单的把 YZe(X) 上跑 OLS. 进一步地, 我们可以把 X 包括进 OLS 拟合, 它在有限样本中可能能提升精度. 不过这不会改变待估计量就是 τO. 我们把这些结果总结如下:

推论

如果 Z{Y(1),Y(0)}|X, 则

  1. YZe(X) 或者 {1,Ze(X)} 上的群体 OLS 中, Ze(X) 的系数是 τO;
  2. Y{1,Z,e(X),X} 上的群体 OLS 中, Z 的系数是 τO.

定理 1.1 启发了一个两步的 τO 的估计方法:

推论 的 (1) 启发了:

推论的 (2) 启发了:

尽管 OLS 对点估计很方便, 但是标准误差会是错误的, 因为第一步倾向得分估计的不确定性. 我们可以用 bootstrap 来近似估计标准误差.

2 用逆倾向得分作为回归权重

2.1 平均因果效应

我们再来看一下 hajek估计量 τ^hajek=i=1nZiYie^(Xi)i=1nZie^(Xi)i=1n(1Zi)Yi1e^(Xi)i=1n1Zi1e^(Xi), 这等于实验/对照组的结果加权均值之差. 数值上, 它等于 Yi(1,Zi) 上 WLS 的 Zi 系数:

命题

τ^hajek 等于如下 WLS 产生的 β^: (α^,β^)=argminα,βi=1nwi(YiαβZi)2, 这里 (2.1)wi=Zie^(Xi)+1Zi1e^(Xi)={1e^(Xi),Zi=1,11e^(Xi),Zi=0.

从这个命题看出, 我们可以通过 WLS 容易地得到 τ^hajek. 当然因为倾向得分估计的不确定性, 我们同样要用 bootstrap 来估计标准误差.

为什么 WLS 能给出 τ 的一致估计量?
在 CRE 中, 我们直接 Yi(1,Zi) 然后用 Zi 的系数估计 τ. 在观察性研究中, 各个样本进对照/实验组的概率是不同的, 但如果我们用 1e(Xi) 去加权处理组, 11e(Xi) 去加权对照组, 则它们都能代表总体. 通过加权, 实际上我们人为制造了一个"伪随机实验".


此外, 基于 WLS 的这个估计量还是双重稳定的.

e(Xi,α^) 为拟合的倾向得分, (μ1(Xi,β^1),μ0(Xi,β^0)) 是结果均值在 WLS 下的拟合值. 结果回归估计量为 τ^wlsreg=1ni=1nμ1(Xi,β^1)1ni=1nμ0(Xi,β^0),
τ 的双重稳定估计量为 τ^T,wlsdr=τ^T,wlsreg+1ni=1nZi{Yiμ1(Xi,β^1)}e(Xi,α^)1ni=1n(1Zi){Yiμ0(Xi,β^0)}1e(Xi,α^).
一个有趣的结果将两者关联:

定理 2.1

如果 X=0, (μ1(Xi,β^1),μ0(Xi,β^0))=(β^10+β^1xTXi,β^00+β^0xTXi), 基于 Yi(1,Zi,Xi,ZiXi) 以及 (2.1) 权重下的 WLS, 则 τ^wlsdr=τ^wlsreg=β^10β^00, 也是 WLS 拟合中 Zi 的系数.

我们用下表总结因果效应的各种回归估计量.

CRE 没有混杂变量的观察性实验
没有 X Yi(1,Zi) Yi(1,Zi), 有权重 wi
X Yi(1,Zi,Xi,ZiXi) Yi(1,Zi,Xi,ZiXi), 有权重 wi

2.2 实验单元的平均因果效应

τT 的结果和 τ 的是平行的. 首先是 τT 的 Hajek 估计量 τ^Thajek=Y^(1)i=1no^(Xi)(1Zi)Yii=1no^(Xi)(1Zi), 这里 o^(Xi)=e^(Xi)1e^(Xi), 等于 Yi(1,Zi) 的如下 WLS 中, Zi 的系数.

命题

τ^Thajek 在数值上等于如下 WLS 得到的 β^: (α^,β^)=argminα,βi=1nwTi(YiαβZi)2, 权重为 (2.2)wTi=Zi+(1Zi)o^(Xi)={1,Zi=1,o^(Xi),Zi=0.

如果我们中心化协变量: X^(1)=0, 则可以用 (2.2) 的 Yi(1,Zi,Xi,ZiXi)Zi 的系数. 类似地, 它等于回归估计量 τ^T,wlsreg=Y^(1)1n1i=1nZiμ0(Xi,β^0), 也等于双重稳健估计量 τ^T,wlsdr=τ^T,wlsreg1n1i=1no^(Xi)(1Zi){Yiμ0(Xi,β^0)}.

定理 2.2

如果 X^(1)=0, μ0(Xi,β^0)=β^00+β^0xTXi (基于 Yi(1,Zi,Xi,ZiXi), 权重来自 (2.2)), 则 τ^T,wlsdr=τ^T,wlsreg=β^10β^00, 也就是 Zi 的系数.


  1. 因为 Ze(X)=Z01e(X)0TX, 且 Ze(X) 与任何 X 的函数不相关. ↩︎